Big Data und der Fluch der Dimensionalität: Die effiziente Suche nach Quasi-Identifikatoren in hochdimensionalen Daten
نویسندگان
چکیده
In smarten Umgebungen werden häufig große Datenmengen durch eine Vielzahl von Sensoren erzeugt. In vielen Fällen werden dabei mehr Informationen generiert und verarbeitet als in Wirklichkeit vom Assistenzsystem benötigt wird. Dadurch lässt sich mehr über den Nutzer erfahren und sein Recht auf informationelle Selbstbestimmung ist verletzt. Bestehende Methoden zur Sicherstellung der Privatheitsansprüche von Nutzern basieren auf dem Konzept sogenannter Quasi-Identifikatoren. Wie solche Quasi-Identifikatoren erkannt werden können, wurde in der bisherigen Forschung weitestgehend vernachlässigt. In diesem Artikel stellen wir einen Algorithmus vor, der identifizierende Attributmengen schnell und vollständig erkennt. Die Evaluierung des Algorithmus erfolgt am Beispiel einer Datenbank mit personenbezogenen Informationen.
منابع مشابه
Planungsdaten schnell finden und einfach nutzen: Linked Open Data und semantische Suche im Einsatz für das KTBL-Datenangebot
Um Entscheidungen fundiert treffen zu können, sind Daten als Grundlage unerlässlich. Der Aufwand für die Recherche nach relevanten Daten sowie die anschließende Aufbereitung der Daten für die Verwendung in Kalkulationswerkzeugen stellen die wesentlichen Herausforderungen für datenbasierte Entscheidungen dar. In diesem Beitrag wird eine Lösung zur Unterstützung von datengestützten Entscheidungen...
متن کاملDiabetes Mellitus in the Elderly
Nach einer Einleitung und Diskussion tiber die Eingenschaften der diabetischen Krankheiten wurde ausflihrlich trber die Aetiologie und Pathophysiologie der Zuckerankheiten,insbesondere der Altersdiabetis,gesprochen.Nach der symptomalogie der Diabetis haben wir die ncueste Einteilung der Zuckerkrankheiten genannt und die Untcrsuchungsmethoden,die heute Uhlich sind,erwahnt;dazu wurden unsere M...
متن کاملKomplexe Objektbeschreibungen Zur Suche in Multimedia-datenbanken Datenbank-spektrum 19/2006 1 1 Einleitung
Die inhaltsbasierte Suche nach Multimediadaten, wie Fotos, Musikstücken oder Filmen, hat durch die jüngsten Entwicklungen in der Unterhaltungselektronik, der Datenübermittlung und der Computertechnologie an allgemeinem Interesse gewonnen. Während früher die Verwaltung großer Mengen von Multimediadaten eher professionellen Anwendern vorbehalten war, existieren heute in vielen Haushalten mehrere ...
متن کاملIntegrating and Updating Domain Knowledge with Knowledge Discovery
Heute übliche Lösungen im Bereich der Wissensentdeckung in Daten (Data Mining bzw. Knowledge Discovery in Data Bases – KDD) bieten keine oder nur unzureichende Werkzeuge, um bei der Suche nach interessanten Mustern in Daten Hintergrundwissen des Anwenders über die Analysedomäne einzubinden. Das hier beschriebene Dissertationsprojekt sucht hierfür eine Lösung durch die Integration von Ansätzen u...
متن کاملDatenschutzorientierte Analyse, Indizierung und Suche von Dokumenten in Sozialen Internetanwendungen
Obwohl es kaum denkbar ist, dass jemand private Informationen wie das Geburtsdatum oder eine private Fotosammlung einer unbekannten Person auf der Straße mitteilt, werden dennoch im Internet solche persönlichen Daten Tag für Tag von Benutzern öffentlich zugänglich gemacht. Nach Bekanntgabe solcher Informationen hat der Benutzer weder Einfluss darauf, wo und wie lange sie gespeichert werden, noc...
متن کامل